ExpFusion
传入一个数组,逐元素计算其乘上输入因子(可选择)后的指数值,再将指数值乘上输出因子后输出。
\[ \begin{align}\begin{aligned}\begin{split}dst_i = \exp(src_i \cdot s_{in}) \cdot s_{out} \quad \text{where} \quad s_{in} = \begin{cases} 1, & scale = 1 \\ in\_scale, & scale \neq 1 \end{cases}\end{split}\\\quad s_{out} = out\_scale\end{aligned}\end{align} \]
- 输入:
src_data - 输入数据地址。
length - 计算长度。
in_scale - 输入缩放因子,当scale != 1时启用。
out_scale - 输出缩放因子。
scale - 输入缩放因子启用控制。
core_mask - 核掩码(仅适用于共享存储版本)。
- 输出:
dst_data - 计算结果地址。
- 支持平台:
FT78NEMT7004备注
FT78NE 支持int8, int16, int32, fp32, fp64, cplx64, cplx128
MT7004 支持fp16, fp32, int16, int32, cplx64
共享存储版本:
-
void i8_expfusion_s(int8_t *src_data, int8_t *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
-
void i16_expfusion_s(int16_t *src_data, half *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
-
void i32_expfusion_s(int *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
-
void hp_expfusion_s(half *src_data, half *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
-
void fp_expfusion_s(float *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
-
void dp_expfusion_s(double *src_data, double *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
-
void c64_expfusion_s(float *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
-
void c128_expfusion_s(double *src_data, double *dst_data, int length, float in_scale, float out_scale, int scale, int core_mask)
C调用示例:
1//FT78NE示例 2#include <stdio.h> 3#include <expfusion.h> 4 5int main(int argc, char* argv[]) { 6 float *input0 = (float *)0xA0000000; //input在DDR空间 7 float *output = (float *)0xC0000000; 8 int length = 1000; 9 float in_scale = 0.5, out_scale = 1.2; 10 int scale = 1; 11 int core_mask = 0xff; 12 fp_expfusion_s( input0, output, length, in_scale, out_scale, scale,core_mask); 13 return 0; 14}
私有存储版本:
-
void i8_expfusion_p(int8_t *src_data, int8_t *dst_data, int length, float in_scale, float out_scale, int scale)
-
void i16_expfusion_p(int16_t *src_data, half *dst_data, int length, float in_scale, float out_scale, int scale)
-
void i32_expfusion_p(int *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale)
-
void hp_expfusion_p(half *src_data, half *dst_data, int length, float in_scale, float out_scale, int scale)
-
void fp_expfusion_p(float *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale)
-
void dp_expfusion_p(double *src_data, double *dst_data, int length, float in_scale, float out_scale, int scale)
-
void c64_expfusion_p(float *src_data, float *dst_data, int length, float in_scale, float out_scale, int scale)
-
void c128_expfusion_p(double *src_data, double *dst_data, int length, float in_scale, float out_scale, int scale)
C调用示例:
1//FT78NE示例 2#include <stdio.h> 3#include <expfusion.h> 4int main(int argc, char* argv[]) { 5 float *input0 = (float *)0x10810000; //input在L2空间 6 float *output = (float *)0x10820000; 7 int length = 1000; 8 float in_scale = 0.5, out_scale = 1.2; 9 int scale = 1; 10 fp_expfusion_p( input0, output, length, in_scale, out_scale, scale); 11 return 0; 12}